Llajú: Un sistema de recuperación multilingüe basado en EuroWordNet
نویسندگان
چکیده
1 Introducción El sistema de recuperación de información multilingüe LLajú aquí presentado viene a ser una implementación del modelo sugerido en [1], con la mejora en el cálculo de probabilidades de traducción a partir de SemCor tal como se describe en [2]. El sistema de recuperación que proponemos es capaz de recuperar artículos de las secciones de nacional e internacional de los sitios de “ABC”, “El Mundo” y “El País”, y de las secciones de internacional del “Washington Post”, “CNN news” y “The Guardian Observer”, correspondientes al año 2001. El proceso de recopilación y formateado del corpus se ha llevado a cabo usando la herramienta WebReader[3].
منابع مشابه
Estudio Bidireccional de un Sistema de RI Multilingüe Basado en Traducción de n-Gramas
Resumen Continuando nuestra investigación sobre el empleo de ngramas de caracteres como unidad de traducción en sistemas de RI Multilingüe, este art́ıculo analiza el comportamiento de nuestra solución en direcciones inversas de traducción a partir de sendos experimentos paralelos con consultas en inglés sobre textos en español y viceversa. Lo positivo de los resultados corrobora la validez de nu...
متن کاملIR-n un sistema de Recuperación de Información basado en pasajes
PhD Thesis in Computer Science written by Fernando Llopis Pascual under the supervision of Dr. José Luis Vicedo González and Dr. Antonio Ferrández Rodŕıguez (University of Alicante Spain). The author was examined in May 6th, 2003 by the commitee formed by Dr. Manuel Palomar Sanz (Univ. de Alicante), Alfonso Ureña López (Univ. de Jaén), Emilio Sanch́ıs Arnal (Univ. Politécnica de Valencia), Migue...
متن کاملConstrucción de un sistema de recuperación multilingüe en la Web
El proyecto ha sido financiado por el Ministerio de Ciencia y Tecnología en su programa de Fomento de la Investigación Técnica (PROFIT) con código FIT-150500-2002-416. La duración del proyecto es de 18 meses. Los grupos participantes son las Universidades de Alicante, Jaén y Sevilla, siendo el investigador responsable y coordinador el Dr. Antonio Ferrández Rodríguez, del departamento de Lenguaj...
متن کاملSistema de Suscripción basado en XML para noticias digitales
Resumen. En este trabajo se plantea la problemática del seguimiento de un gran flujo de información entrante en una base documental, y la notificación de las novedades significativas a los usuarios de acuerdo a los perfiles definidos en sus suscripciones. Se propone un sistema de suscripción que utiliza un nuevo lenguaje basado en XML, que permite especificar consultas considerando la estructur...
متن کاملMedidas de Usabilidad de Componentes Software
La última década ha marcado el primer intento real de convertir el desarrollo software en una ingeniería usando los conceptos de Desarrollo Software Basado en Componentes (DSBC) y de Componentes COTS (Commercial Off-The-Shelf) cuyo objetivo es crear elementos de alta calidad que se puedan ensamblar para construir un sistema funcional. Uno de los procesos críticos dentro del DSBC es la selección...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 27 شماره
صفحات -
تاریخ انتشار 2001